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Chapitre 1 

Loi normale 


Exercice 1. 

La demande mensuelle d’un produit obeit a une loi normale. Elle a une probabilite 0,1 d’etre inferieure 
a 15 000 unites (resp. superieure a 25 000 unites). 

1. Quels sont les parametres de cette loi? 

2. Calculer la probabilite qu’en un mois la demande depasse 23 000 unites. 

3. Quel doit etre le stock pour ne risquer une rupture qu’avec une probabilite d’environ 0.1% ? 


Exercice 2. 

Une societe envisage la mise en place de nouveaux equipements. Dans le cadre de ce projet, elle a defini 
trois taches A, B et C. On sait que la tache A dure 10 semaines et que les taches B et C ont des durees 
aleatoires independantes ; la duree de B obeissant a la loi normale de moyenne 18 et d’ecart-type 4, la 
duree de C obeissant a la loi normale de moyenne 20 et d’ecart-type 5. 

1. Quelle est la probabilite que la tache B (resp. C) dure entre 18 et 25 semaines? 

2. Quelle est la probabilite que la duree totale D des trois taches ne depasse pas 55 semaines ? 

3. Determiner un intervalle centre sur Pesperance mathematique dans lequel se trouve la duree totale 
avec une probabilite de 0,75. 


Exercice 3. 

Les ampoules de la marque A ont une duree de vie moyenne de 2500 heures avec un ecart-type de 500 
heures, celles de la marque B ont une duree de vie moyenne de 2300 heures avec un ecart-type de 800 
heures. On preleve 300 ampoules A et 200 ampoules B. 

1. Quelle est la loi de la duree de vie moyenne des 300 ampoules A (resp. des 200 ampoules B) ? 

2. Quelle est la probabilite que la duree de vie moyenne des 300 ampoules A ne soit pas superieure 
de plus de 100 heures a la duree de vie moyenne des 200 ampoules B ? 

3. Quelle est la probabilite que l’ecart entre les deux durees de vie moyenne ne depasse pas 40 heures ? 


Exercice 4 (juin 2009). 

Un balladeur mp3 fabrique par la compagnie Multisonic est garanti contre tout defaut de fabrication pour 
une periode de 2 ans. D’apres l’experience de la compagnie, les chances d’observer une non-conformite 
majeure durant les 26 mois (respectivement 52 mois) suivant l’achat sont de 1 sur 100 (respectivement 
975 sur 1000). Supposons que le temps X requis apres l’achat pour qu’une non-conformite majeure se 
presente soit distribue normalement. 

1. Determiner les parametres de cette gaussienne. 

2. Quelle est la probabilite que l’appareil presente une non-conformite majeure avant la fin de la 
periode de garantie ? 


5 



3. Quelle devrait etre la periode de garantie si Multisonic ne souhaitait remplacer que 0,05% des 
appareils vendus ? 

Exercice 5 (juin 2009). 


Si deux charges sont appliquees a une poutre en porte-a-faux 
selon le schema ci-contre, le moment flechissant a O du aux 
charges est M F = c\X 1 + C 2 X 2 . 

Supposons que c\ = 2 mm, que C 2 = 6 mm et que X\, X 2 soient des variables aleatoires independantes 
respectivement de moyenne 5 kN et 8kN, d’ecart-type 0,25 kN et 0,40 kN. 

1. Determiner l’esperance et l’ecart-type du moment flechissant. Soit X, Y des variables aleatoires 
independantes et a , b des reels. Alors 

Var(X +Y}m Var{X) + Var{Y) et Var(aX + b) = a 2 Var(X) 

2. Si X\ et X 2 sont distributes normalement, quelle est la probability que le moment flechissant soit 
super ieur a 64 Kn.mm ? 

Exercice 6 (janvier 2010). 

La vitesse (km/h) des voitures passant a un certain point d’une route peut etre consideree comme une 
variable aleatoire de loi normale. Par observation, on trouve que 95% des voitures a une vitesse inferieure 
a 150 km/h et 10% a une vitesse inferieure a 90 km/h. 

1. Determiner les parametres de cette loi. 

2. Calculer le pourcentage de voitures roulant entre 120 et 140 km/h. 

Exercice 7 (juin 2010). 

Un bar debite la biere en chopes dont le contenu effectif est une variable aleatoire X supposee gaussienne 
de moyenne m = 25 cl et d’ecart-type o = 2 cl. 

1. Determiner la probability que votre chope de biere contienne : 

(a) plus de 26 cl de biere. 

(b) moins de 23 cl de biere. 

2. Determiner la probability pour qu’il y ait moins de 1 cl d’ecart entre votre chope et celle de votre 
ami. 

Exercice 8 (janvier 2011). 

Une machine remplit automatiquement des boites de sucre en poudre de telle fagon que le poids de sucre 
effectivement contenu dans une boite soit une variable aleatoire normale de parametres m et a exprimes 
en grammes. On souhaite regler la machine de sorte que le poids de sucre contenu dans une boite depasse 
980 grammes avec une probability de 95%. 

1. Lorsque cr = 30, quelle valeur faut-il donner a la moyenne ml 

2. Lorsque m = 1000, quelle valeur doit avoir l’ecart-type cr? 

Exercice 9 (janvier 2011). 

Une entreprise decide de construire des sieges de bureau reglables en hauteur. Si h est la hauteur du 
siege par rapport au sol dans sa position la plus basse, alors 2 h est la hauteur du siege dans sa position 
la plus elevee. 

Afin de determiner la valeur optimale de h, l’entreprise a eflectue une enquete aupres de sa clientele et 
a mesure pour chaque individu, la hauteur H du siege qui lui paraissait la plus confortable. 

L’enquete a montre que H pouvait etre ajustee par une loi gaussienne, autour d’une esperance m = 48 
cm. 

1. Quelle est la hauteur h que l’entreprise doit choisir de fagon a satisfaire le maximum de sa clientele ? 

2. Quelle serait alors la proportion de clientele satisfaite si o = 8 1 
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Chapitre 2 

Estimation 


Exercice 10. 

Un fabricant et livreur de pizzas a domicile desire faire une etude sur le temps moyen qui s’ecoule entre 
le moment ou la commande est passee par telephone et le moment oil le client est livre. Une observation 
rapide faite sur 25 commandes fait ressortir un temps moyen de 27 mn. 

En supposant que le temps de fabrication-livraison suive une loi normale d’esperance to et d’ecart-type 
1, donner un intervalle de confiance pour to au seuil 95%. 


Exercice 11. 

On suppose que le chiffre d’affaires journalier X d’un hypermarche est distribue selon une loi normale 
d’esperance to et d’ecart-type inconnu. Durant 31 jours, on a releve la valeur du chiffre d’affaires (en 
milliers d’euros) et obtenu le resultat suivant : 

31 31 

Xi = 279 et ^ x\ = 2945 

Donner un intervalle de confiance pour to au seuil 95%. 


Exercice 12. 

On vous demande de faire une enquete afin de determiner le pourcentage des votants qui exerceront leur 
droit de vote lors du prochain referendum. On exige de vous une estimation du pourcentage au seuil 95% 
avec une incertitude de ±2%. 

Quel est le nombre minimal de personnes que vous devez interroger ? 


Exercice 13. 

Une etude realisee sur la vitesse coronarienne X fournit, pour 18 individus, les resultats suivants : 
75, 77, 78, 77, 77, 72, 72, 72, 70, 71, 69, 69, 68, 66, 64, 66, 62, 61 
On en tire : x = 70.33 et s = 5.09 

1. Donner une estimation ponctuelle de la moyenne et de la variance de X. 

2. On suppose que X ~ N(m\ \/26). 

Determiner l’intervalle de confiance de to au niveau 0,98. 

3. On suppose maintenant que X ~ Af(m: a). 

(a) Determiner l’intervalle de confiance de m au niveau 0,98. 

(b) Determiner l’intervalle de confiance de a 1 au niveau 0,98. 
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Exercice 14 (juin 2009). 

L’entreprise Metallo a effectue des essais en traction sur des tiges metalliques employees dans l’assemblage 
de structures. Notons X la resistance a la traction (en kg/cm 2 ) d’esperance m et de variance a 1 = 900. 
Des essais sur 50 tiges fournissent un echantillon de moyenne 380 kg/cm 2 . 


1. Notons Xi la resistance a la traction de la i-ieme tige de l’echantillon et X = 


une approximation de la loi de 


\/50 


(X-m). 


50 


50 

Xi . Determiner 


2. En deduire un intervalle de confiance pour m au seuil 95%. 


Exercice 15 (juin 2009). 

Un releve effectue par le responsable du service informatique d’une entreprise multinationale indique 
l’utilisation suivante (en minutes par heure) pour neuf terminaux choisis au hasard : 

| 28,3 | 26,4 | 27,0 | 22,5 | 23,5 | 29,1 | 26,8 | 26,7 | 30,9 

On en tire : x = 26.8 et s* = 2.6 

1. Quelle hypothese devons-nous faire pour determiner un intervalle de confiance au seuil 95% pour 
la moyenne d’utilisation de tous les terminaux de cette entreprise ? Preciser alors cet intervalle. 

2. En conservant cette hypothese, determiner un intervalle de confiance au seuil 95% pour la variance. 


Exercice 16 (juin 2010). 

A partir des vitesses relevees ci-dessous, estimer par intervalle de confiance au niveau 95%, dans les 
deux cas suivants, la vitesse moyenne de tous les vehicules circulant en France en supposant la vitesse 
gaussienne de moyenne m et d’ecart-type a. 


Vitesse de 20 vehicules en km 

/h 

124 

105 

94 

93 

106 

101 

90 

91 

118 

115 

100 

96 

112 

109 

89 

102 

95 

89 

88 

108 


On en tire : x = 101.25 et s* = 10.62 

1. Si a = 9. 

2. Si a est inconnu. 


Exercice 17 (juin 2010). 

Les dernieres campagnes de controle, effectuees chez un grand brasseur, laissent supposer que la precision 
des remplisseuses les plus anciennes n’est plus egale a sa valeur initiale de 0,1 cl. 

A partir des contenances relevees ci-dessous, estimer par intervalle de confiance au niveau 95 %, l’ecart- 
type de la production totale en supposant la contenance des bouteilles gaussienne. 


Contenance de 20 bouteilles en cl 


On en tire : s 2 = 0.0116 


Exercice 18 (janvier 2011). 

En mai 2006, le ministre de l’Economie des Finances et de l’Industrie a mis en place la declaration 
de revenus preremplie par radministration. Les premiers controles effectues sur un echantillon de 780 
declarations d’imposition preremplies montrent que 12% des ces declarations presentent au moins une 
erreur. Le montant moyen des erreurs, calcule a l’euro pres, etant de 3500 euros. On supposera l’ecart-type 
cr connu egal a 800 euros. 

1. Donner un intervalle de confiance au niveau 95% pour les parametres suivants : 

(a) La proportion p de declarations erronees. 

(b) Le montant moyen m des erreurs. 

2. Donner le nombre minimal de declarations a controler pour avoir au niveau 95% : 

(a) une incertitude n’excedant pas 2% pour la proportion p de declarations erronees. 

(b) une incertitude n’excedant pas 50 pour le montant moyen to des erreurs. 


Exercice 19 (janvier 2011). 

Void les detentes seches (en cm) de 30 basketteurs representatifs des basketteurs du Nord. 
La detente seche sera supposee gaussienne de moyenne to et d’ecart-type cr. 


Detente 

57 

58 

59 

60 

61 

62 

63 

64 

65 

Effectif 

1 

5 

1 

5 

3 

7 

2 

2 

4 


On en tire : x = 61.23 et s 2 = 5.52 

1. Estimer par intervalle de confiance au niveau 98% les parametres suivants (des basketteurs du 
Nord) : 

(a) L’ecart-type de la detente seche. 

(b) La detente seche moyenne. 

2. En supposant maintenant a connu egal a 2.37, estimer par intervalle de confiance au niveau 98% 
la detente seche moyenne des basketteurs du Nord. 

3. Comparer les intervalles de confiance pour to et commenter. 

4. Refaire les questions l.(b) et 2. sans supposer la detente seche gaussienne. 
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Chapitre 3 


Tests statistiques 


Exercice 20. 

Le cahier des charges du principal client d’un fabricant de cartes a puces impose une proportion de cartes 
defectueuses dans la production totale, inferieure ou egale a 0,5%. Suite a une livraison contenant 0,7% 
de cartes defecteuses, selon le client, le fournisseur decide de controler un echantillon de taille 1000. 

1. Six cartes etant defectueuses, tester < ' P auseuilde2%? 

[ Hx :p = 0,007 

2. Calculer le risque de deuxieme espece puis commenter. 

Exercice 21. 

Deux echantillons independants et gaussiens ont donne les resultats suivants : 

tia = 40, xa = 25.2, s* A = 5.2 et ns = 50, xb = 22.8, s* B = 6 

La difference observee entre les deux moyennes empiriques est-elle statistiquement significative au seuil 
de 5%? 

Exercice 22 (juin 2010). 

Les associations de consommateurs font appel a des organismes independants pour tester les 
caracteristiques avancees par les fabricants pour de nombreux produits. Une des questions soulevees 
est relative a l’influence, sur la consommation d’electricite, de l’utilisation d’un adoucisseur d’eau pour 
alimenter la machine a laver. L’entartrage n’intervenant qu’apres une utilisation prolongee, les 42 
machines testees sont agees de 4 ans. 

A partir des relevees ci-dessous, decider si l’efficacite de l’adoucisseur est statistiquement significative 
au seuil de 5% en supposant les consommations avec adoucisseur ( X A ) et sans adoucisseur (X B ) 
gaussiennes et independantes. 

Indice : on effectuera pour cela un test unilateral de comparaison de moyennes precede d’un test de 
comparaison de variances, les deux au seuil de 5% 


25 consommations avec adoucisseur (A) en kw/h 


17 consommations sans adoucisseur (B) en kw/h 


On en tire : xa = 0.815, s* A = 0.013, xb = 0.891 et s^ 2 = 0.010 
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Chapitre 4 

Regression lineaire 


Exercice 23. 

Le tableau suivant donne la consommation X de graisse ainsi que le taux Y de mortalite par 
athlerosclerose pour 100 000 habitants de la Norvege sur une periode couvrant la seconde guerre mondiale. 


Date 

Consommation de graisse en 
kg par an et par personne 

Tanx de mortalite par 
atherosclerose pour 100 000 
habitants 

1938 

14.4 

29.1 

1939 

16.0 

29.7 

1940 

11.6 

29.2 

1941 

11.0 

26.0 

1942 

10.0 

24.0 

1943 

9.6 

23.1 

1944 

9.2 

23.0 

1945 

10.4 

23.1 

1946 

11.4 

25.2 

1947 

12.5 

26.1 


1. Construire le nuage de points representant ces donnees. 

2. Determiner l’equation de la droite d’ajustement de Y en X . 

3. Calculer le coefficient de determination r 2 . 

La consommation de graisse explique t’elle la mortalite par atherosclerose? 

Exercice 24. 

Un physicien a mesure le volume V et la pression P d’un gaz. Ses resultats sont consignes dans le tableau 
suivant. 


Volume en cm 3 

1069 

1216 

1425 

1746 

2334 

3818 

Pression en g/ cm 3 

3778 

3056 

2321 

1753 

1185 

623 


Montrer qu’il existe entre P et V une relation de la forme : PV 1 = C. 

Exercice 25 (mars 2009). 

Une entreprise realise une etude de marche avant de commercialiser des logiciels a usages professionnels. 
1. Exploitation statistique d’un modele passe. 

Des concurrents ont recemment vendu un produit similaire. Le nombre de logiciels vendus chaque 
mois est donne par le graphique ci-contre : 
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Un extrait est fourni dans le tableau suivant : 


Rang du mois x - L 

1 

6 

11 

16 

21 

26 

31 

36 

Nombre de logiciels vendus Zi 

60 

250 

340 

360 

320 

270 

220 

200 


(a) Sans calcul, justifier qu’un ajustement lineaire n’est pas approprie. 

(b) Reproduire et completer le tableau suivant (les y* seront arrondies au centieme) : 


Rang du mois Xi 

1 

6 

11 

16 

21 

26 

31 

36 

Vi = ln (ft) 

4,09 






1,96 

1,71 


(c) Determiner le coefficient de correlation lineaire r entre x et y au millieme pres. 

Que peut-on en deduire ? 

(d) Donner une equation de la droite de regression de y en x sous la forme y = ax + b ou a et b 
sont deux reels arrondis au millieme. 

(e) En prenant des arrondis plus larges pom: a et b, on obtient : 

In = —0, 07a: + 4 

Exprimer alors 2 en fonction de x. 

2. Perspectives 

L’equipe commerciale envisage de mener une campagne plus dynamique, pour son nouveau produit 
plus complet. Le nombre mensuel des ventes serait modelise par la fonction / definie sur l’intervalle 
[0;36] par /( x) = lOOxe -0,1 *. 

(a) Dresser le tableau de variations de /. 

(b) Tracer la courbe representative de /. 

(c) L’entreprise arretera la commercialisation du produit des que le nombre de ventes repassera 
au-desssous de 150 unites par mois. Determiner, a l’aide du graphique, a partir de quel mois 
cessera cette commercialisation. 

Exercice 26 (novembre 2010). 

Les operateurs de telephonie mobile ont besoin de prevoir les taux de penetration sur le marche du 
telephone mobile pour les annees a venir. En effet, ce sont les previsions du marche qui leur permettent 
de definir les strategies d’investissement et d’innovation. 

Les taux d’equipement observes depuis 1998 jusqu’a septembre 2004 sont indiques sur le graphique 
suivant. En 2003, le taux de penetration en Prance est de 69%, ce qui positionne la France au niveau du 
Japon et loin derriere l’ltalie. 
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Taux d'equipement en telephones portables de 
1998 a 2004 en France 


2001 

AnneeX 


II s’agit d’ajuster le nuage de points par une courbe, afin d’utiliser celle-ci pour prevoir les taux 

k 

d’equipement futurs. L’observation suggere un ajustement logisitique Y = , .. . Les fonctions 

1 + ke~^ aX+b > 

logistiques sont bien adpatees pour modeliser devolution dans le temps des ventes d’un produit depuis 
sa creation. En effet, il n’est pas rare que la phase de demarrage soit suivie d’une phase de croissance 
forte, elle meme suivie d’une derniere phase de stagnation : 

Un exemple de fonction logistique 


1. Montrer que l’ajustement logistique Y = , . se ramene a l’ajustement lineaire Y' = 

1 + ke~^ aA+b > 

aX' + b avec X’ = X et Y' = ln(^). 

k 

2. Determiner lim , y , .. quand a > 0. 

x->+oo 1 + ke ~( aX+b ) 

3. Pour les deux valeurs suivantes de k qui represente le seuil de saturation, realiser l’ajustement 
logistique en precisant bien les valeurs de a et 6 ainsi que le coefficient de determination r 2 : 

(a) fc = 0, 83 

(b) A: = 0,78 

4. Quel modele doit-on privilegier pour une previson a court terme ? 
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Exercice 27 (avril 2012). 

MOULICAF envisage de racheter l’entreprise RAPENEX, entreprise concurrente confrontee a de delicats 
problemes de succession. Le chiffre d’affaires des derniers exercices est le suivant (en millions de livres 
poldaves), apres correction de l’incidence de l’inflation : 


Annee 

t 

x t 

1998 

0 

126 

1999 

1 

115 

2000 

2 

165 

2001 

3 

192 

2002 

4 

176 

2003 

5 

237 


1. Modeliser cette serie chronologique a l’aide du modele lineaire X = aT + b en precisant bien les 
parametres. 

2. Donner le coefficient de determination r 1 2 3 et interpreter le resultat. 

3. Notons X* = at + b le chiffre d’affaires estime par le modele et e t = x t — x* l’ecart residuel entre le 
chiffre d’affaires observe et celui estime par le modele. 

(a) Determiner les 6 ecarts residuels, leur moyenne et leur variance s 2 ^ t . 

(b) Determiner la variance s 2 des x t et comparer s 2 ^ avec (1 — r 2 )s|. 

4. Modeliser maintenant la serie chronologique a l’aide des modeles suivants en precisant bien les 
parametres ainsi que le modele lineaire equivalent utilise : 

(a) Le modele quadratique X = aT 2 + b 

(b) Le modele exponentiel X = ax b T 

5. Choisir le meilleur des trois modeles en justifiant la reponse. 

6. En utilisant le modele choisi, prevoir le chiffre d’affaires de l’exercice 2004. 

Exercice 28. 

Un agent immobilier possede huit studios a louer dans une banlieue de Paris. II a note dans un tableau 
la distance X de ces studios a la station de RER la plus proche ainsi que le montant Y du loyer mensuel. 


Distance en km 

0,54 

0,90 

1,26 

1,98 

2,16 

4, 14 

5,22 

5,4 

Loyer mensuel en Francs 

3300 

3000 

3120 

2460 

2760 

2280 

2400 

2280 


1. Representer graphiquement ces donnees. 

2. Adapter a ces donnees un modele lineaire puis un modele puissance. 

Quel est le meilleur modele ? 

3. Determiner, au niveau 95%, l’intervalle de previson du loyer pour une distance de 6 km. 

Exercice 29 (inspire de novembre 2009). 

Considerons les donnees trimestrielles suivantes relatives a des souscriptions de contrats d’assurance vie 
de fin mars 2000 a fin decembre 2002 : 
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Nuagede points 



*- 

♦ 


6 8 10 12 14 


1. On ajuste cette serie par le modele lineaire : Y = at + b. 

Calculer les coefficients de ce modele par la methode des moindres carres. 

2. On ajuste maintenant cette serie par le modele quadratique : Y = at 1 2 3 + b. 

Calculer les coefficients de ce modele par la methode des moindres carres. 

3. Quel modele choisissez-vous (justifiez votre reponse) ? 

4. Determiner, au niveau 95%, l’intervalle de previson du nombre de contrats souscrits a la fin du 
mois de decembre 2003. 

Exercice 30 (inspire de avril 2010). 

Le tableau suivant presente 1’evolution du taux de mortalite infantile M (pour 1000) de 1950 a 2004. 


Annee 

1950 

1955 

1960 

1965 

1970 

1975 

1980 

1985 


0 


10 

15 

20 

25 

30 

35 


M 

51.9 
38,6 
27,4 

21.9 
18,2 
13,8 

10 

8,3 


Annee 

1990 

1995 

2000 

2001 

2002 

2003 

2004 
2010 


40 

45 

50 

51 

52 

53 

54 


M 

7.3 
4,9 

4.4 

4.5 
4,1 


3,9 


1. Ajuster un modele exponentiel de la forme M = ae' 3T en precisant bien les parametres. 

2. La qualite de cet ajustement est-elle correcte? 

3. Determiner, a partir de ce modele, le taux de mortalite infantile prevu en 2010. 

4. Determiner, au niveau 95%, l’intervalle de previson du taux de mortalite infantile en 2010. 
Exercice 31 (inspire de avril 2011). 

Dans un circuit electrique, on a releve 1’evolution temporelle de la tension aux bornes d’un appareil 
inconnu, repris dans le tableau ci dessous : 


T (en ms) 

0.2 

0.4 

0.6 

0.8 

1 

1.2 

1.4 

1.6 

1.8 

2.0 

2.2 

2.4 

2.6 

2.8 

3.0 

U (en Volt) 

5.7 

5.5 

5.3 

5.1 

4.9 

4.8 

4.5 

4.2 

3.8 

3.4 

3.0 

2.5 

2 

1.4 

0.7 


1. Representer ce nuage de points. 

2. On ajuste cette serie par le modele lineaire U = aT + b. Determiner les coefficients de ce modele. 

3. Determiner, au niveau 95%, l’intervalle de previson de la tension pour un temps de 3,3 ms. 
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Exercice 32 (inspire de novembre 2011). 

Le tableau ci-dessous donne revolution du nombre de personnes agees en milliers (Y) de plus de 85 ans, 
en France metropolitaine, de 1950 a 2000. 


1960 I 1965 I 1970 


290 361 423 


1. Ajuster un modele exponentiel de la forme Y = ae l3x , cet ajustement est-il correct? 

2. Determiner, au niveau 95%, l’intervalle de previson du nombre de personnes agees de plus de 85 
ans en 2010. 
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Chapitre 5 


Analyse de variance 


Exercice 33. 

Des eleves choisis au hasard dans une promotion sont repartis en trois groupes, et leurs notes a Tissue 
de l’epreuve de statistique sont inscrites dans le tableau suivant. Le groupe a-t-il un effet significant sur 
la note ? 


Groupe 1 

Groupe 2 

Groupe 3 

19 

7 

11 

19 

7 

13 

17 

8 

20 

7 

11 

2 

13 

20 

1 

17 

16 

16 

7 

13 

5 

13 

6 

2 

8 

2 

8 

15 

19 

14 

3 

14 

6 

19 

12 

16 

7 

6 

2 

20 

10 

16 

14 

19 

6 

14 

20 

8 

9 

13 

11 

17 

2 

4 

19 

19 

13 

3 

20 

5 

8 

10 

20 

15 

3 

19 

6 

8 

10 

5 

4 

6 

19 


17 

9 


10 

19 


20 

6 



3 



17 



3 



6 



7 



8 



18 
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Exercice 34. 

Le tableau suivant presente les salaires annuels bruts d’individus au bout de cinq ans d’experiences 
selon leur niveau de formation initiate. Qu’en pensez-vous ? 


Licence 

Master 

Doctorat 

35,9 

39,7 

25,6 

32,5 

32,6 

48,2 

36 

25,7 

47,3 

28,1 

35,4 

29,3 

22,4 

29,1 

35,6 

23,5 

40,3 

26,4 

24,6 

27,6 

28,6 

21,5 

22,1 

47,5 

24,2 

28,9 

35,8 

23,7 

31,6 

42,6 

30,7 

32,5 

45 


Exercice 35. 

A partir du tableau suivant, preciser si le facteur A (resp. B) a un effet significatif. 



B1 

B2 

B3 

B4 

B5 

A1 

1,2 

1,3 

1,5 

1,3 

1,6 

A2 

1,3 

1,4 

1,2 

1,4 

1,2 

A3 

1,3 

1,2 

1,4 

1,3 

1,5 

A4 

1,2 

1,1 

1,3 

1,5 

1,4 


1. On considere le rendement de trois varietes de mais dont la culture a ete effectuee avec cinq 
engrais differents. Dans le tableau suivant, chaque observation est specifique a une variete et un 
engrais. II s’agit de tester le rendement moyen des parcelles en tenant compte de deux facteurs de 
variability : la variete et le type d’engrais. Effectuer les tests avec un seuil de 5%. 


Engrais 

Variete 1 

Variete 2 

Variete 3 

A 

256 

226 

200 

B 

205 

250 

170 

C 

199 

212 

180 

D 

156 

170 

190 

E 

193 

220 

200 


2. On dispose maintenant de deux observations pour chacun des trois echantillons de varietes de 
mais et chacune des cinq categories d’engrais. Effectuer les tests necessaires pour decider du bien 
fonde d’une selection d’une variete particuliere de mais et/ou de l’usage d’engrais. On commencera 
evidemment par l’etude des interactions (pourquoi?). Le seuil des differents tests est fixe a 5%. 


Engrais 

Variete 1 

Variete 2 

Variete 3 

A 

183 

187 

205 


256 

226 

200 

B 

199 

192 

194 


205 

250 

170 

C 

193 

196 

200 


199 

212 

180 

D 

198 

197 

199 


156 

170 

190 

E 

187 

207 

190 


193 

220 

200 
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Exercice 37. 

Un fabricant de coussinets en bronze fritte se propose de determiner si la resistance a la rupture du 
bronze depend des lots de poudre de cuivre et d’etain utilises pour son elaboration. On realise a partir 
de trois lots differents de poudre de cuivre (facteur A) et de trois lots differents de poudre d’etain 
(facteur B), neuf melanges de composition identiques (90% de cuivre et 10% d’etain), correspondants 
aux neuf combinaisons deux a deux des lots de cuivre et d’etain utilises. A partir de chacun de ces 
melanges, on comprime, sous une meme pression, quatre eprouvettes de flexion identique. Les trente-six 
eprouvettes obtenues sont ensuite frittees en une meme operation dans un four a atmosphere reductrice. 
Ces eprouvettes sont enfin cassees sur une machine d’essai. Les charges de rupture ainsi determinees 
arrondies a 0.12 kg /mm pres sont reportees dans le tableau ci-apres, en hectogrammes. 



B1 

B2 

B3 

A1 

6 

1 

0 


7 

1 

5 


3 

4 

6 


8 

3 

2 

A2 

1 

6 

0 


6 

4 

3 


7 

4 

2 


4 

10 

2 

A3 

6 

8 

2 


10 

3 

4 


8 

7 

3 


7 

7 

7 


1. L’interaction de l’etain et du cuivre a-t-il un effet significatif sur la resistance au seuil de 5% ? 

2. L’etain (resp. le cuivre) a-t-il un effet significatif sur la resistance au seuil de 5%? 2%? 

Exercice 38. 

L’influence de 4 additifs de carburant (A) sur les emissions d’oxyde d’azote doit etre determinee. De plus, 
il est prevu d’utiliser pour les essais, 4 vehicules (B) et 4 conducteurs (C) distincts. Les essais realises 
ont conduit aux resultats reportes dans le tableau ci-dessous : 



B1 

B2 

B3 

B4 

A1 

Cl 21 

C2 26 

C4 20 

C3 25 

A2 

C4 23 

C3 26 

Cl 20 

C2 27 

A3 

C2 15 

C4 13 

C3 16 

Cl 16 

A4 

C3 17 

Cl 15 

C2 20 

C4 20 


1. L’additif a-t-il un effet significatif sur les emissions d’oxyde d’azote au seuil de 5%? 

2. Le vehicule a-t-il un effet significatif sur les emissions d’oxyde d’azote au seuil de 5%? 

3. Le conducteur a-t-il un effet significatif sur les emissions d’oxyde d’azote au seuil de 5% ? 10% ? 
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Partiel de Probabilities et Statistique 
HEI3 

Novembre 2012 


Duree : 2 heures 

Autorise : calculatrice et recto-verso manuscrit 
Le bareme n'est donne qu'a titre indicatif 

Exercice 1 (2 points) 

La taille moyenne des pygmees d'une tribu est de lm40. 10% des pygmees de cette tribu font plus de 
lm50. En supposant que la taille des pygmees suive une loi normale, quel est I'ecart-type de cette 
distribution ? 

Exercice 2 (6 points) 

La taille d'un epi de ble dans un champ est modelisee par une variable aleatoire X de loi normale 
hi (15; 6) (unite : le cm). 

1. Quelle est la probability pour qu'un epi ait une taille inferieure a 16 cm ? 

2. On admet qu'il y a environ 15 millions d'epis dans le champ. Donner une estimation du 
nombre d'epis de plus de 20 cm. 

3. Quelle est la probability pour qu'un epi preleve dans le champ ait une taille dans I'intervalle 
[16; 20]? 

4. On suppose que la taille d'un epi de ble d'un autre champ est modelisee par une variable 
aleatoire Y de loi normale A J(10;4) et que X et Y sont des variables aleatoires 
independantes. Quelle est la probability pour qu'un epi pris dans le premier champ soit plus 
grand qu'un epi pris dans le second ? 

Exercice 3 (3 points) 

Parmi un groupe de malades qui se plaignent de ne pas bien dormir, certains ont absorbe un 
somnifere sous forme de cachets, d'autres ont absorbe des cachets de sucre (tous pensaient qu'on 
leur avait administre un somnifere). Apres quoi, on leur a demande si les cachets ont ete efficaces ? 

Le tableau suivant indique les differentes reponses. En supposant que tous les malades aient dit la 
verite, tester I'hypothese qu'il n y a aucune difference entre le somnifere et le sucre au seuil de 
signification de 0.05. 



Ont bien dormi 

N'ont pas bien dormi 

Ont pris le somnifere 

44 

10 

Ont pris du sucre 

81 

35 


Exercice 4 (5 points) 

Des etudes pedagogiques ont etabli que pour une bonne comprehension des matieres enseignees, 
les etudiants d'une university devraient consacrer en moyenne 45 heures de travail par semaine, 
avec un ecart-type de 9 heures, selon la discipline. Desirant savoir si la situation actuelle differe 
sensiblement ou non de cette opinion, on a considere un echantillon aleatoire de 36 etudiants 


inscrits I'annee consideree dans cette university auxquels il a ete pose la question 
suivante : « Combien d'heures par semaine consacrez-vous a vos etudes ? » 

1. Les reponses de ces 36 etudiants ayant donne une moyenne de 47.2 heures d'etude par 
semaine, peut-on affirmer, au seuil de signification de 5%, que le nombre d'heures d'etude 
des etudiants est significativement plus eleve que la norme ? 

2. Calculer I'erreur de seconde espece puis la puissance du test, en considerant precisement 
comme hypothese alternative HI : m = 46. 

Exercice 5 (4 points) 

On a teste le pH, suppose gaussien, de deux types de solutions chimiques A et B. L'analyse de 6 
echantillons de A a donne un pH moyen de 7.52 avec un ecart-type de 0.024. L'analyse de 5 
echantillons de B a donne un pH moyen de 7.49 avec un ecart-type de 0.032. La difference entre les 
deux types de solutions est-elle significative au seuil de signification de 0.05 ? 

Exercice 6 (bonus 2 points) 

En se referant aux dates de debut du pontificat (dates de consecration) et de fin (par deces, 
demission ou inaptitude), la duree d'exercice de chacun des 263 precedents papes (excepte Jean-Paul 
II) a ete calculee en nombre d'annees. Les resultats groupes en cinq tranches sont presentes dans le 
tableau suivant : 


Pontificat 

Nombre de papes 

Moins d'une annee 

46 

1 an - 5 ans 

76 

5 ans - 10 ans 

67 

10 ans - 20 ans 

63 

20 ans et plus 

11 

Total 

263 


Que penser, au seuil de signification de 5%, de I'hypothese selon laquelle la distribution du pontificat 
des papes serait une distribution exponentielle ? 


Examen de Statistique 
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- Duree : 2 heures 

- Autorises : calculatrice et recto-verso manuscrit 

- Le bareme n’est donne qu’a titre indicatif 


Exercice 1 (7,5 points). 

Une ecole d’ingenieur souhaite creer un partenariat avec une grande entreprise. Avant d’accepter, 
le departement des ressources humaines de l’entreprise decide de choisir au hasard 62 etudiants 
de derniere annee et de leur faire passer un test permettant de mesurer diverses aptitudes. Nous 
presentons dans le tableau suivant, entre autres, la repartition des resultats X obtenus. 


Classes [a,b[ 

Effectifs 

P(a < X < b) 

60 < X < 80 

10 

0,16 

80 < X < 90 

12 

0,21 

90 < X < 100 

18 


100 < X < 110 

15 

0,20 

110 < X < 140 

7 

0,16 


1. L’echantillon a une moyenne de 94,8 et un ecart-type de 15,7. 

Expliquer comment ont ete calculees ces deux caracteristiques. 

2. On veut savoir si X peut etre supposee gaussienne. 

(a) Preciser la loi de X utilisee pour calculer les probability dans le tableau ? 

(b) Calculer P(90 < X < 100). 

(c) Est-il possible de supposer que X suive une loi normale? La reponse sera justifiee a l’aide 
d’un test. 

3. Donner un intervalle de confiance, au niveau 95%, pour : 

(a) la moyenne theorique m de X. 

(b) la variance theorique cr 2 de X. 

4. Que represented m et a 2 ? 

5. L’entreprise signera le partenariat a condition que l’ecole ait des resultats conformes a la 
moyenne nationale qui est, pour ce type de test, egale a 100. 

(a) Que fera l’entreprise compte-tenu de l’echantillon observe ? 

(b) Quelle est la probability que l’entreprise se trompe avec une telle decision ? 


Exercice 2 (5 points). 

La distance d’arret d’un vehicule est egale a la distance de reaction (distance parcourue entre le 
moment ou le conducteur pergoit un obstacle et celui ou il appuie sur la pedale de frein) augmentee 
du chemin de freinage (distance parcourue entre le debut du freinage et 1’ arret total). Le tableau 
suivant fournit pour 12 vitesses V un chemin de freinage C mesure en metres. 




Vitesse V 

Chemin de freinage C 

40 

8,8 

50 

11 

60 

19,8 

70 

27 

80 

39 

90 

44,6 

100 

58 

110 

78 

120 

79,4 

130 

93,1 

140 

108 

150 

124 


1. A l’aide de l’annexe 1, preciser pour chacun des modeles suivants une estimation (ponctuelle) 
des parametres a et f3 ainsi que du coefficient de determination : 

(a) Modele lineaire : C ~ aV + /3. 

(b) Modele puissance : C ~ aV 6 . 

2. (a) Pourquoi avons-nous utilise le signe ~ plutot que le signe =? 

(b) A quel modele correspond le tableau inutilise de l’annexe 1 ? 

3. (a) Quel est le meilleur des modeles ? 

(b) Donner un intervalle de confiance, au niveau 95%, pour le a du modele choisi? 

(c) A l’aide du modele choisi, donner un intervalle de prevision pour le chemin de freinage a 
une vitesse de 170 km/h, au niveau 95%. 

Exercice 3 (2,5 points). 

Une entreprise, oeuvrant dans le domaine de la transformation du metal en feuille, vient d’afficher 
divers postes dans un nouveau departement. Avant d’en arriver a la selection des candidats, la 
responsable des ressources humaines a administre un test de perception des formes a un echantillon 
d’individus provenant de trois secteurs de l’entreprise. Les resultats sont presentes dans le tableau 
suivant. 


Atelier mecanique 

Assemblage 

Manutention 

89 

93 

76 

92 

91 

83 

92 

104 

73 

80 

82 

84 

92 

103 

82 

74 

88 

94 

79 

86 

91 

82 

102 

83 

99 

97 

85 

94 

86 

87 

72 

85 

81 

82 

102 

93 

81 

89 

91 

76 

94 

91 

72 

88 

87 

92 

90 

79 




1. Calculer, en justifiant, les elements manquants (cellules grisees) dans le tableau d’analyse de 
variance ci-dessous. 


10 

ANALYSE DE VARIANCE 





11 

Source des variations 

Somme des carres 

Degre de liberty 

Moyenne des carres 

F 

Probability 

Valeur critique pour F 

”12] 

Entre Groupes 






1 1 

13 

A I'interieur des groupes 

2429 






14 








15 

Total 

3095 
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2. Le secteur de l’entreprise a-t-il un effet significatif au seuil de 5% sur la performance (moyenne) 
au test ? 


Exercice 4 (3,5 points). 

Une entreprise fabrique une piece mecanique particuliere pour un fabricant d’ automobiles. Quatre 
machines peuvent etre utilisees pour usiner cette piece. Cinq operateurs sont susceptibles de travailler 
sur ces machines. Toutefois l’operation de ces machines requiert une certaine dexterite qui peut varier 
d’un operateur a l’autre et affecter les resultats (le temps d’usinage). Les observations sont regroupees 
dans le tableau suivant. 



Machine 1 

Machine 2 

Machine 3 

Machine 4 

Operateur 1 

21,2 

19,9 

20,1 

20,6 

Operateur 2 

19,6 

20,0 

20,2 

21,1 

Operateur 3 

19,8 

20,2 

20,6 

21,7 

Operateur 4 

19,9 

21,1 

21,7 

22,1 

Operateur 5 

21,8 

21,5 

22,5 

21,1 


1. Indiquer si les operateurs ont un effet significatif sur le temps d’usinage au seuil de 5% : 
(a) A l’aide du tableau obtenu avec une ANOVA a 1 facteur : 


ANALYSE DE VARIANCE 




Source des variations Somme des carres 

Degre de liberte 

Moyenne des carres F 

Probability Valeur critique pour F 

Entre Groupes 6,053 

4 

1,51325 2,825863679 

0,062547376 3,055568276 

A I'interieur des groupes 8,0325 

15 

0,5355 






| Total 14,0855 
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(b) A l’aide du tableau obtenu cette fois avec une ANOVA a 2 facteurs que l’on completera 


au besoin : 


ANALYSE DE VARIANCE 


Source des variations Somme des carres 

Degre de liberte Moyenne des carres F Probability Valeur critique pour F 

Lignes 

0,04939031 

Colonnes 2,4855 

Erreur 5,547 




(Total 




2. Comment peut-on justifier cette contradiction apparente? 

3. Les machines ont-elles un effet significatif sur le temps d’usinage au seuil de 5% ? 


Exercice 5 (1,5 points). 

Une directrice marketing veut etudier 1’ effet de deux facteurs sur les ventes d’une denree alimentaire 
et ceci pour une periode de quinze jours. Les facteurs consideres sont la hauteur de la tablette et la 
position de bailee. Dix-huit magasins ont ete selectionnes et 2 ont ete affectes a chaque traitement 
(combinaison position de bailee et hauteur de la tablette). Le nombre d’unites vendues pendant la 
quinzaine observee est presente dans le tableau suivant. 



45 cm 

75 cm 

115 cm 

A l’avant 

70 

82 

106 


60 

74 

92 

Au milieu 

38 

40 

52 


36 

34 

44 

A l’arriere 

48 

60 

80 


44 

48 

66 


Les questions suivantes sont a traiter au seuil de 0,1% a l’aide de l’annexe 2. 

1. L’ interaction des deux facteurs a-t-elle un effet significatif sur les ventes? 

2. La hauteur de la tablette a-t-elle un effet significatif sur les ventes? 

3. (a) La position de bailee a-t-elle un effet significatif sur les ventes? 

(b) Est-il possible de privilegier une position de bailee par rapport aux deux autres ? 




Annexe 1 : trois regressions lineaires 

Regression lineaire entre V (variable explicative) et C (variable expliquee) 



A B 

C 

D E 

F 

T] 

RAPPORT DETAILLE 




2 





3 

Statistiques de la regression 




4 

Coefficient de determination multiple 

0,990374008 




5 

Coefficient de determination R A 2 

0,980840675 




6 

Coefficient de determination R A 2 

0,978924743 




^7j 

Erreur-type 

5,628335427 




8 

Observations 

12 




9 
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ANALYSE DE VARIANCE 




11 

Degre de liberte 

Somme des carres 

Moyenne des carres F 

Valeur critique deF 

12 

Regression 1 

16217,28757 

16217,28757 511,939069 

6,40468E-10 

13 

Residus 

10 

316,7815967 

31,67815967 


14 

Total 

11 

16534,06917 
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16 


Coefficients 

Erreur-type 

Statistique t Probability 


17 

Constante 

-43,61002331 

4,757366007 

-9,166842165 3,50703E-06 


18 

V 

1,06493007 

0,047066505 

22,62607056 6,40468E-10 
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Regression lineaire entre V (variable explicative) et Y = In C (variable expliquee) 



A B 

C 

D 

E 

F 

1 

RAPPORT DETAILLE 











3 

Statistiques de la regression 





4 

Coefficient de determination multiple 

0,973320942 





5 

Coefficient de determination R A 2 

0,947353656 





6 

Coefficient de determination R A 2 

0,942089022 





J7j 

Erreur-type 

0,212670701 





8 

Observations 

12 





9 







10 

11 

12 

ANALYSE DE VARIANCE 







Degre de liberte 

Somme des carres 

Moyenne des carres 

F 

Valeur critique de F 

Regression 

1 

8,138778764 

8,138778764 

179,9467132 

l,01787E-07 

13 

Residus 

10 

0,45228827 

0,045228827 



14 

15 

16 
17 

Total 

11 

8,591067035 









Coefficients 

Erreur-type 

Statistique t 

Probability 

Constante 

1,49554027 

0,179760495 

8,319627003 

8,34123E-06 

18 

19 

V 

0,023856768 

0,001778442 

13,41442184 

1.01787E-07 






Regression lineaire entre X = In V (variable explicative) et Y = In C (variable expliquee) 



A 

B 

C 

D 

E 

E 

1 

RAPPORT DETAILLE 




2 





3 

Statistiques de la regression 




4 

Coefficient de determination multiple 

0,995671732 





5 

Coefficient de determination R A 2 

0,991362198 





6 

Coefficient de determination R A 2 

0,990498418 





7 

Erreur-type 

0,086144029 





8 

Observations 

12 





9 





10 

ANALYSE DE VARIANCE 




11 


Degre de liberte 

Somme des carres 

Moyenne des carres 

F 

Valeur critique de F 

12 

Regression 

1 

8,516859097 

8,516859097 

1147,701897 

1,18764E-11 

1.3 

Residus 

10 

0,074207938 

0,007420794 



14 

Total 

11 

8,591067035 




15 




16 


Coefficients 

Erreur-type 

Statistique t 

Probability 


17 

Constante 

-5,56253445 

0,276359804 

-20,12787089 

2,01641E-09 


18 

X = In V 

2,082185828 

0,061461752 

33,8777493 

1,18764E-11 
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Annexe 2 


A 

b c o ; e ; f 

G 

1 Analyse de variance: deux facteurs avec repetition d'experience 



2 



3 RAPPORT D£T AILLt 

45 cm 75 cm 115 cm Total 


4 At'wafrt 









7 Moyenne 

65 78 99 80,66666667 


8 Variance 

50 32 98 271,4666667 


9 



10 Aumtieu 





12 Somme 

74 74 96 244 


13 Moyenne 

37 37 48 40,66666667 



2 18 32 42,66666667 


15 



16 At'wiere 



17 Nombre dechantillons 

2 2 2 6 


92 108 146 346 


19 Moyenne 

46 54 73 57,66666667 


20 Variance 

8 72 98 189,4666667 


21 



22 1 Total 



23 Nombre dechantillons 

6 6 6 

24 Somme 

296 338 440 


25 Moyenne 

49,33333333 56,33333333 73,33333333 


26 Variance 

175,4666667 363,8666667 565,8666667 


27 i 



~28~| 



29 ANALYSE OE VARIANCE 



30 Sourco das variations 

Somme dascarros BaorodaUxarto fibsaannsda^o-amas F Probabifoa 

V-ahurorFauooourF 

31 Echantillon 

4836 2 2418 53,07804878 1.04304E-05 


32 Colonnes 

33 Interaction 

1828 2 914 20,06341463 0,000482122 

280 4 70 1,536585366 0,271576363 


34 1 A I'interieur du groupe 

410 9 45,55555556 


¥l 1 
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- Autorises : calculatrice et recto-verso manuscrit 
-Tables statistiques en annexe 

Exercice 1. 

On mesure la force de compression d'un ciment en moulant de petits cylindres et en mesurant la 
pression X (exprimee en kg/cm 2 ) a partir de laquelle ils se cassent. Pour 10 cylindres utilises, on releve 
les pressions suivantes : 

19.6 19.9 20.4 19.8 20.5 21.0 18.5 19.7 18.4 19.4 

On suppose que X suit une loi de Gauss de moyenne m et d'ecart-type a. (Les intervalles de confiance 
seront determines au niveau de 95%). 

10 10 

1. Admettons que '^ j x i =197.2 et ^xf =3894.88. 

a) Determiner une estimation ponctuelle non biaisee pour m et a 2 . 

b) Determiner maintenant un intervalle de confiance pour m et a 2 . 

2. Supposons dans cette question a 2 = 0,69. 

a) Determiner dans ces conditions un intervalle de confiance pour m. 

b) Comparer le resultat du 2. a) avec celui du l.b). 

c) Determiner la taille minimale de I'echantillon pour avoir une estimation a t0.2 kg/cm 2 
Exercice 2. 

Sur 4000 naissances, on releve 2065 gargons. 

1. Que pouvons-nous alors penser de I'idee selon laquelle il y'a une chance sur deux d'avoir un 
gargon a la naissance (On repondra a la question successivement au seuil de 5% puis 1%) ? 

2. Au seuil de 5 %, quelle est la probability de se tromper en suivant la conclusion du test ? 

Exercice 3 . 

Dans une ecole d'ingenieurs, les notes de Statistique de deux promotions suivent des lois normales : 
X 1 ~N(m 1 ; cTi) et X 2 ~N(m 2 , a 2 ) . Un echantillon de 25 notes pour X x fournit une moyenne de 12 
et un ecart-type de 3. Quant a X 2 , un echantillon de 10 notes fournit une moyenne de 13 et un ecart- 
type de 4. Peut-on considerer au seuil de 5% que la deuxieme promotion est meilleure que la 
premiere ? 



Exercice 4 . 


Chez un individu adulte, le logarithme du dosage de d-dimeres, variable que nous noterons X, est 
modelise par une loi normale d'esperance p et de variance a 2 . La variable X est un indicateur de risque 
cardio-vasculaire : on considere que chez les individus sains, p vaut -1, alors que chez les individus a 
risque, p vaut 0. On souhaite etudier I'influence de la consommation d'huile d'olive sur le risque 
cardio-vasculaire. 

1. On a fait suivre un regime a base d'huile d'olive a un groupe de 13 patients, precedemment 
consideres comme a risque. Apres le regime, on a mesure la valeur de X pour chaque patient, et 
obtenu une moyenne empirique de -0.15. On suppose a 2 connu et egal a 0.09. 

a) Donner la regie de decision du test de H 0 : p = 0, contre H 1 : p = -1, au seuil de 5%. 

b) Quelle est votre conclusion ? 

c) Calculer le risque de deuxieme espece et la puissance du test. 

2. Pour le meme groupe de 13 patients, on a observe un ecart-type empirique egal a 0.37. 

a) Donner la regie de decision du test de H 0 :a 2 = 0.09, contre H^.o 2 * 0.09, au seuil de 5% 

b) Quelle est votre conclusion ? 

3. En supposant la variance inconnue et en utilisant I'estimation de la question precedente. 

a) Donner la regie de decision du test de H 0 : p = 0, contre H 1 : p < 0, au seuil de 5%. 

b) Quelle est votre conclusion ? 

4. On suppose dans cette question que X n'est plus supposee gaussienne. On reprend 
I'experience sur un groupe de 130 patients, pour lesquels on observe une moyenne empirique de 
-0.12 et un ecart-type de 0.32. 

a) Donner la regie de decision du test de H 0 : n = 0, contre H 1 : jU < 0, au seuil de 5%. 

b) Quelle est la p-valeur correspondant a -0.12 ? (la p-valeur est le seuil pour lequel la valeur 
observee de la statistique de test serait la limite de la region de rejet. C'est la probability sous 
H 0 que la statistique de test soit au-dela de la valeur deja observee.) 

c) Quelle est votre conclusion ? 



Examen de Statistique 

HEI 3 - 11 juin 2013 


- Duree : 2 heures 

- Autorises : calculatrice et recto-verso manuscrit 

- Le bareme n’est donne qu’a titre indicatif 

Sauf mention contraire, on realisera les tests au seuil de 5% en detaillant bien les etapes. 


Exercice 1 (5 points). 

Le tableau ci dessous indique pour un echantillon de 9 etudiants de troisieme annee, le nombre X de 
jours consacres a preparer les examens de fin de semestre et Y la moyenne obtenue sur 20. 


X 

43 

45 

47 

53 

55 

57 

61 

65 

67 

Y 

7,2 

7,3 

8,1 

8,4 

10 

10,4 

12 

12,6 

14,3 


Les options graphiques d’Excel et son utilitaire d’analyse permettent d’obtenir les 
resultats fournis en Annexe. 

1. (a) Pour le modele lineaire, donner l’ordonnee a l’origine de la droite. 

(b) Pour le modele exponentiel, donner le coefficient de determination. 

(c) Pour le modele puissance, completer le resultat fourni par l’utilitaire d’analyse. 

2. Quel modele ajuste au mieux le nuage de points? 

3. En utilisant le meilleur des modeles, donner pour un etudiant ayant consacre 75 jours a preparer 
ses examens : 

(a) Une estimation ponctuelle de sa moyenne. 

(b) Un intervalle de prevision de sa moyenne. 


Exercice 2 (4 points). 

1. En realisant un test de comparaison a partir des donnees suivantes, peut-on rejeter l’idee selon 
laquelle il y’aurait plus de femmes a fumer que d’hommes? 



Homme 

Femme 

Fumeur 

24 

41 

Non fumeur 

23 

35 


2. En realisant un test du chi 2, etudier la dependance entre l’environnement familial et le fait de 
fumer. 



Pere fumeur et 
mere fumeuse 

Pere fumeur et 
mere non fumeuse 

Pere non fumeur et 
mere fumeuse 

Pere non fumeur et 
mere non fumeuse 

Fumeur 

13 

16 

7 

29 

Non fumeur 

5 

24 

6 

23 




Exercice 3 (6 points). 

Dans le cadre d’un concours comptant 1500 candidats, un des correcteurs rend ses 100 copies au 
secretariat qui etablit la distribution suivante : 


Classes 

[0,4[ 

[4,8[ 

[8,12[ 

[12, 16[ 

[16,20[ 

Effectifs 

8 

22 

30 

28 

12 


1. Peut-on considerer que les notes suivent une loi normale? La reponse sera justifiee par un test. 

2. Estimer par intervalle de confiance, au niveau 95%, la moyenne et la variance des candidats. 

3. Calculer la barre d’admission si le concours offre 150 places. 


Exercice 4 (5 points). 

Dans cet exercice, on utilisera les sorties Excel fournies que l’on completera au besoin. 

Le detail des tests mis en oeuvre pour repondre n’est pas attendu. 

Nous nous proposons d’analyser l’influence du temps et de trois especes ligneuses d’arbre sur la 

decomposition de la masse d’une litiere constitute de feuilles de Lierre. 

1. Pour ce faire, 12 sachets d’une masse identique de feuilles de lierre ont ete constitues, sachets 
permettant une decomposition naturelle. Puis une premiere serie de 4 sachets, choisis au hasard, 
a ete deposee sous un chene, une deuxieme sous un peuplier, et la derniere serie sous un frene. 
Apres 2, 7, 10 et 16 semaines respectivement, un sachet est preleve au hasard sous chaque 
arbre et la masse residuelle est determinee pour chacun d’eux. Cette masse est exprimee en 
pourcentage de la masse initiale. 


Semaine 

Chene 

Peuplier 

Frene 

2 

85 

85 

84 

7 

75 

73 

72 

10 

71 

74 

67 

16 

62 

67 

58 


Une ANOVA a deux facteurs sans repetition fournit le resultat suivant : 




RAPPORT DETAILLE 


Nombre d'echantillons Somme 


84.66666667 0,333333333 

73.33333333 2,333333333 

70.66666667 12,33333333 

62.33333333 20,33333333 

73,25 90,91666667 
70,25 117,5833333 


.4 ANALYSE DE VARIANCE 


Source des variations 


Somme des carres Degre de liberte Moyenne des carres 


Probabitite Valeur critique pour F 


28,66666667 

836,25 


(a) Le temps a-t-il un effet significatif sur la decomposition ? 

(b) L’espece de l’arbre a-t-elle un effet significatif sur la decomposition ? 

2. En utilisant 24 sachets, nous disposons maintenant de deux observations par arbre pour chaque 


semaine. 


Semaine 

Chene 

Peuplier 

Frene 

2 

85 

85 

84 


87 

84 

85 

7 

75 

73 

72 


72 

75 

70 

10 

71 

74 

67 


66 

71 

64 

16 

62 

67 

58 


64 

60 

59 


Une ANOVA a deux facteurs avec repetitions fournit le resultat suivant : 

35 1 ANALYSE DE VARIANCE 

36 1 Source des variations Somme des carres Degre de liberte Moyenne des canes F Probability Valeur critique pour F 

1718,833333 
61,58333333 


(a) L’interaction entre le temps et l’espece de l’arbre a-t-elle un effet significant sur la 
decomposition ? 

(b) Le temps a-t-il un effet significant sur la decomposition ? 

(c) L’espece de l’arbre a-t-elle un effet significant sur la decomposition ? 

(d) L’ ANOVA a deux facteurs fournissant des reponses differentes suivant qu’elle est sans ou 
avec repetitions, quelle reponse doit-on privilegier quant a l’effet de l’espece de l’arbre sur 
la decomposition ? 

3. En ne considerant que les differentes especes, une ANOVA a un facteur fournit le resultat 
suivant : 



ANALYSE DE VARIANCE 





Source des variations 

Somme des carres 

Degre de liberte 

Moyenne des carres 

F 

Probability 

Valeur critique pour F 

j Entre Groupes 

61,58333333 

2 

30,79166667 

0,357202044 

0,703800357 

3,466800112 

J A I'interieur des groupes 

1810,25 

21 

86,20238095 











Total 

1871,833333 

23 






(a) L’espece de l’arbre a-t-elle un effet significant sur la decomposition ? 

(b) Donner la decomposition des carres totaux a l’origine de l’ANOVA a un facteur. 

(c) Indiquer la variable de decision utilisee dans 1’ ANOVA a un facteur ainsi que sa loi. 

(d) Expliquer pourquoi la conclusion n’est pas pertinente en comparaison avec l’ANOVA a 
deux facteurs. 



Annexe 1 : trois graphiques 


™ 5 f ?? Modele lineaire 





Annexe 2 : trois regressions lineaires 


Regression lineaire entre X (variable explicative) et Y (variable expliquee) 


1 

A | 

B 

C 


| RAPPORT DETAILLE 

[ 


2 




S 

Statistiques de la regression 


4 

Coefficient de determination multiple 

0,975257205 


5 

Coefficient de determination R A 2 

0,951126615 


6 

Coefficient de determination R A 2 

0,944144703 


~7~1 

Erreur-type 

0,594964656 


8 

Observations 

9 


9 




10 

ANALYSE DE VARIANCE 



ii 


Degre de liberte 

Somme des carres 

12 

Regression 

1 

48,2221194 

13 

Residus 

7 

2,477880597 

14 

Total 

8 

50,7 

15 




16 


Coefficients 

Erreur-type 

17 

Constante 

??? 

1,350116302 

18 

X 

0,284552239 

0,024379794 


Regression lineaire entre X (variable explicative) et In Y (variable expliquee) 


A 

B 

C 

1 RAPPORT DETAILLE 


2| 


3 Statistiques de la regression 


4 Coefficient de determination multiple 

0,983806065 


5 Coefficient de determination R A 2 

0,967874374 


6 Coefficient de determination R A 2 

0,963284999 


7 Erreur-type 

0,047547323 


8 Observations 

9 


9 


10 ANALYSE DE VARIANCE 


u 

Degre de liberte 

Somme des carres 

12 Regression 1 

0,476779501 

13 Residus 

7 

0,015825235 

14 Total 8 

0,492604736 

15 


16 

Coefficients 

Erreur-type 

17 Constante 

0,728473013 

0,107896183 

18 X 

0,028294215 

0,001948341 


Regression lineaire entre In X (variable explicative) et In Y (variable expliquee) 



A 

B 

C 

1 

RAPPORT DETAILLE 


T| 



3 

Statistiques de la regression 


4 

Coefficient de determination multiple 

0,977836092 


~5~1 

Coefficient de determination R A 2 

0,956163422 


6 

Coefficient de determination R A 2 

0,949901054 


7 | 

Erreur-type 

0,055541627 


8 

Observations 9 


9 



10 

ANALYSE DE VARIANCE 


11 

Degre de liberte 

Somme des carres 

12 

Regression 1 

0,47101063 

13 

Residus 

7 

0,021594106 

14 

Total 8 

0,492604736 

15 



16 

Coefficients 

Erreur-type 

17 

Constante 

??? 

0,491635073 

18 

In x 

??? 

0,123065531 



Examen de Statistique 


HEI 3 - novembre 2013 


- Duree : 2 heures 

- Autorises : calculatrice et recto-verso manuscrit 

- Le bareme n’est donne qu’a titre indicatif 

Sauf mention contraire, on realisera les tests au seuil de 5% en detaillant bien les etapes. 


Exercice 1 (4 points). 

Une entreprise remplit des boites de 200 g de chocolats. 

1. On suppose dans cette question (uniquement) que le poids d’une boite de chocolats suive une 
loi normale. La probabilite qu’il soit superieur a 230 g est de 0,02 et celle qu’il soit inferieur a 
180 g est de 0,015. 

(a) Determiner les parametres de la loi. 

(b) Quelle est la probabilite que le poids d’une boite soit inferieur a 200 g ? 

(c) Quelle est la probabilite que la difference entre les poids de deux boites soit inferieure a 
20g? 

2. On suppose maintenant que les boites de chocolats aient un poids moyen de 207 g avec un ecart 
type de 20 g. L’entreprise livre les chocolats aux grandes surfaces par cartons de 100 boites. 

(a) Quelle est la loi du poids moyen de 100 boites? 

(b) Quelle est la probabilite que la difference entre les poids moyens de 100 boites dans deux 
cartons soit superieure a 10 g? 


Exercice 2 (5 points). 

Sur une parcelle de soja, on a mesure la hauteur en cm de 100 plantes a l’age de 6 semaines. 

On obtient les resultats suivants apres regroupememt par classes et en considerent pour les hauteurs 
les centres des classes : 


Hauteurs 

36 

37 

38 

39 

40 

41 

Effectifs 

6 

11 

26 

32 

14 

11 


Supposons la hauteur gaussienne de moyenne m et d’ecart-type a. 

1. (a) Determiner un intervalle de confiance a 95% pour a. 

(b) Determiner un intervalle de confiance a 95% pour m. 

2. Supposons maintenant a = 2. 

(a) Determiner un intervalle de confiance a 95% pour m. Calculer son incertitude. 

(b) Comparer et commenter les deux intervalles obtenus pour m. 

(c) Determiner le nombre de plantes a mesurer pour avoir une estimation de m avec une 
confiance de 95% et une incertitude n’excedant pas 2mm. 




Exercice 3 (5 points). 

On etudie le taux de reussite au baccalaureat 2013 dans une serie donnee. 

1. Le taux de reussite nationale au baccalaureat 2012 dans cette serie etait de 67%. 

(a) Dans un centre d’examen A comptant 3500 candidats, il y a eu 216 regus sur 300 candidats 
choisis au hasard sans remise. 

i. L’echantillon peut-il etre considere comme etant aleatoire simple autrement dit le 
tirage peut-il etre considere comme etant avec remise ? 

ii. Les resultats de ce centre sont ils conformes aux resultats nationaux de 2012 ? 

(b) Dans un centre d’examen B comptant 2500 candidats, il y a eu 128 regus sur 200 candidats 
choisis au hasard sans remise. 

Les resultats de ces deux centres sont ils significativement differents ? 

2. On souhaite maintenant estimer, avec une confiance de 98% et une incertitude n’excedant pas 
2%, le taux de reussite nationale au baccalaureat 2013 dans cette serie. Determiner alors la 
taille minimale de l’echantillon a observer ? 


Exercice 4 (6 points). 

On souhaite interpreter l’influence de la prise d’un medicament sur un taux d’anticorps produit. 
L’echantillon A, constitue d’individus non traites, est de taille 50. On observe un taux moyen de 1,6 
et une variance de 1,8. 

L’echantillon B, constitue d’individus traites, est de taille 40. On observe un taux moyen de 3 et une 
variance de 2,3. 

1. En supposant le taux d’anticorps produit gaussien, le traitement est-il efficace? 

2. En ne supposant plus le taux d’anticorps produit gaussien, le traitement est-il efficace? 



Examen de Statistique 

HEI 3-20 janvier 2014 


- Duree : 2 heures 

- Autorises : calculatrice et recto-verso manuscrit 

- Le bareme n’est donne qu’a titre indicatif 

Sauf mention contraire, on realisera les tests au seuil de 5% en detaillant bien toutes les 
etapes : hypotheses, variable de decision et sa loi, region critique, valeur observee de la 
variable de decision et enfin conclusion 

Exercice 1 (5 points). 

En biostatistique, une etude de la croissance d’une population de campagnols des champs (Microtus 
Arvalis) a fourni, pour le nombre d’individus N suivant le temps T (en mois), les resultats suivants : 


T 

2 

4 

6 

8 

10 

12 

14 

N 

5 

16 

20 

40 

100 

200 

320 


En Annexe, vous trouverez les resultats fournis par les options graphiques d’Excel et 
son utilitaire d’analyse. 

1. (a) Pour le modele lineaire, donner le coefficient directeur de la droite. 

(b) Pour le modele puissance, donner le coefficient de determination. 

(c) Pour le modele exponentiel, completer le resultat fourni par l’utilitaire d’analyse. 

2. Quel modele a juste au mieux le nuage de points? 

3. En utilisant le meilleur des modeles, donner pour 18 mois : 

(a) Une estimation ponctuelle du nombre d’individus. 

(b) Un intervalle de prevision du nombre d’individus. 

Exercice 2 (5,5 points). 

1. Une etude menee en 1991 a mis en evidence le caractere gaussien du QI au sein de la population : 

Fisure 1 

The Normal Distribution of IQ Scores 



IQ Scores 55 70 85 100 115 130 145 


Scanne de : "SENSE AND NONSENSE ABOUT IQ" 

Charles LOCURTO - Ed. Praeger (NY) 1991 - Page 5 




(a) A partir de la courbe de Gauss ci-dessus, determiner le QI moyen. 

(b) En utilisant l’aire sous la courbe entre 70 et 130, justifier que l’ecart-type du QI vaut 15. 

(c) Determiner l’aire sous la courbe : 

- a gauche de 85 c’est a dire P(QI < 85) 

- entre 85 et 100 

- entre 100 et 115 

- a droite de 115 

2. Une etude plus recente sur 40 individus fournit les resultats suivants : 


QI 

Effectifs 

< 85 

1 

[85 ; 100[ 

11 

[100; 115[ 

19 

> 115 

9 


La modelisation du QI de 1991, par la loi normale de moyenne 100 et d’ecart-type 15, est-elle 
encore adaptee? La reponse sera justifiee a l’aide d’un test du chi 2. 

Exercice 3 (2 points). 

On desire savoir s’il existe une dependance entre l’age d’un individu atteint du cancer et ses chances 
de guerison. On mene une enquete sur trois classes d’age et on obtient les resultats suivants : 



Gueri 

Non gueri 

50 - 60 ans 

1409 

507 

60 - 70 ans 

763 

248 

70 - 80 ans 

571 

192 


Quelle est votre conclusion? La reponse sera justifiee a l’aide d’un test du chi 2. 

Exercice 4 (7,5 points). 

Dans cet exercice, on utilisera les sorties Excel fournies que l’on completera au besoin. 
Les differentes etapes des tests mis en oeuvre pour repondre aux questions ne sont pas 
attendues ici. 

Dans le cadre d’une etude pedagogique, quatre methodes d’apprentissage sont experimentees. 

1. A Tissue de la formation, une evaluation est proposee a 12 etudiants (trois pour chacune des 
methodes Ml, M2, M3 et M4) dont les resultats sont regroupes dans le tableau suivant : 


Ml 

M2 

M3 

M4 

15 

45 

56 

39 

27 

65 

47 

43 

37 

76 

43 

72 


Une ANOVA a un facteur fournit : 




B | C 

D 

[ E 

| F 1 

G 

i 

lAnalyse de variance: un facteur 1 













4 

RAPPORT DETAILLE 






Groupes 

Nombre d'echantillons Somme 

Moyenne 

Variance 

5 

Ml 

3 79 

26,33333333 

121,3333333 



6 

M2 

3 186 

62 

247 



7\ 

M3 

3 146 

48,66666667 

44,33333333 



8 

M4 

3 154 

51,33333333 

324,3333333 









10 







- 

ANALYSE DE VARIANCE 






Source des variations 

Somme des carres Degre de liberte 

Moyenne des carres 

F 

Probability 

Valeur critique pour F 

Entre Groupes 






14 

A I’interieur des groupes 






15 j 







16 

Total 








La methode d’apprentissage a-t-elle un effet significatif sur la note obtenue lors de 1’evaluation? 
2. En considerant le QI des etudiants (Cl si QI < 100, C2 si 100 < QI < 115 et C3 si QI > 115), 
on peut en fait voir les donnees precedentes de la maniere suivante : 



Ml 

M2 

M3 

M4 

Cl 

15 

45 

56 

39 

C2 

27 

65 

47 

43 

C3 

37 

76 

43 

72 


Une ANOVA a deux facteurs sans repetition fournit : 


n 

A | 

B 

C 

P 

| E 

[ F G 



! 












RAPPORT DETAILLE 

Nombre d'echantillons 

Somme 

Moyenne 

Variance 

Cl 

4 

155 

38,75 

300,25 

5 

C2 

4 

182 

45,5 

243,6666667 


6 

C3 

4 

228 

57 

394 


7~j 







8 

Ml 

3 

79 

26,33333333 

121,3333333 


9 

M2 

3 

186 

62 

247 


10 

M3 

3 

146 

48,66666667 

44,33333333 


12 

M4 

3 

154 

51,33333333 

324,3333333 







13 







16 

ANALYSE DE VARIANCE 






Source des variations 

Somme des carres 

Degre de liberte 

Moyenne des carres 

F 

Probability Valeur critique pour F 

Lignes 





0,155615643 

17 

Colonnes 






18 

Erreur 

792,8333333 





19 







20 

Total 







(a) La methode d’apprentissage a-t-elle un effet significatif sur la note? 

(b) Commenter les reponses obtenues aux questions 1. et 2. (a). 

(c) Le QI a-t-il un effet significatif sur la note ? 

3. En choisissant, par couple deux etudiants plutot qu’un seul, on obtient les donnees 

suivantes : 



Ml 

M2 

M3 

M4 

Cl 

15 

45 

56 

39 

20 

45 

54 

26 

C2 

27 

65 

47 

43 

42 

95 

58 

28 

C3 

37 

76 

43 

72 

67 

78 

82 

65 


Une ANOVA a deux facteurs avec repetition fournit : 


29 | ANALYSE DE VARIANCE 


s Degre de liberte Moyenne 


(a) L’interaction entre la methode d’apprentissage et le QI a-t-elle un effet significatif sur la 
note? 

(b) Le QI a-t-il un effet significatif sur la note ? 

(c) Commenter les reponses obtenues aux questions 2.(c) et 3.(b). 

(d) Est-il possible de considerer que la methode 2 soit plus efficace que la methode 3 ? 




Annexe 1 : trois graphiques 





Annexe 2 : trois regressions lineaires 

Regression lineaire entre T (variable explicative) et N (variable expliquee) 


A 

B C 

1 IRAPPORT DETAILLE 

2 

3 Statistiques de la regression 

4 Coefficient de determination multiple 

0,905717888 

5 Coefficient de determination R A 2 

0,820324892 

6 Coefficient de determination R A 2 

0,78438987 

7 Erreur-type 

55,0982888 

8 Observations 

7 

9 

10 ANALYSE DE VARIANCE 

11 

Degre de liberte Somme des carres 

12 Regression 

1 69301,75 

13 Residus 

5 15179,10714 

14 Total 

6 84480,85714 

15 

16 

Coefficients Erreur-type 

17 Constante 

46,56655321 


18 T 5,206298922 


Regression lineaire entre T (variable explicative) et In N (variable expliquee) 


1 A B 

C 

1 IRAPPORT DETAILLE 


2 


3 Statistiques de la regression 


4 Coefficient de determination multiple 

0,99251865 


5 Coefficient de determination R A 2 

0,98509327 


6 Coefficient de determination R A 2 

0,982111924 


7 | Erreur-type 

0,198964094 


8 Observations 

7 


9 


10 ANALYSE DE VARIANCE 


11 Degre de liberte 

Somme des carres 

12 Regression 1 

13,08020027 

13 Residus 

5 

0,197933553 

14 |Total 6 

13,27813383 

15 


16 

Coefficients 

Erreur-type 

17 1 Constante 

??? 

0,168155351 

18 IT 

??? 

0,01880034 


Regression lineaire entre In T (variable explicative) et In N (variable expliquee) 


A 

B 

c 

1 IRAPPORT DETAILLE 

2 

3 Statistiques de la regression 

4 Coefficient de determination multiple 

0,963973713 


5 Coefficient de determination R A 2 

0,929245318 


6 Coefficient de determination R A 2 

0,915094382 


7 Erreur-type 

0,433472059 


8 | Observations 

7 


9 

10 ANALYSE DE VARIANCE 

11 

Degre de liberte 

Somme des carres 

12 1 Regression 

1 

12,33864369 

13 Residus 

5 

0,939490131 

14 jTotal 

6 

13,27813383 

15 

16 

Coefficients 

Erreur-type 

17 Constante 

-0,181975408 

0,520298897 

18 |ln(T) 

2,094032555 

0,258410899 


Examen de Statistique 
HEI 3 - Mars 2014 


Duree : 2 heures 

Autorises : calculatrice et recto-verso manuscrit 
Le bareme n'est donne qu'a titre indicatif 


(Sauf mention contraire, les tests seront realises au seuil de 5%, en detaillant scrupuleusement les differentes 
etapes) 


Exercice 1. (6 points) 

La duree de vie d'un appareil d'un certain type est modelisee par une variable aleatoire normale de 
moyenne et d'ecart-type inconnus. Comme on voudrait, cependant, que les % de la production de ces 
appareils aient une duree de vie entre 100 et 180 jours, et que par ailleurs, 3% de cette production ait 
une duree de vie superieure a 180 jours : 

1) Determiner les parametres m et a de la duree de vie d'un appareil 

2) Quelle est la probability que la duree de vie d'un appareil soit comprise entre 80 et 100 jours. 

3) Determiner la duree de vie maximale previsible des 30% des appareils qui durent le moins. 

4) Determiner la duree de vie minimale previsible des 20% des appareils qui durent le plus. 

5) On considere un deuxieme type d'appareil dont la duree de vie est cette fois-ci modelisee par 
une variable aleatoire normale de moyenne 110 et d'ecart-type 25. Les durees de vie des deux 
types d'appareils etant supposees independantes, determiner la probability qu'elles 
s'ecartent I'une de I'autre, de moins de 10 jours. 


Exercice 2. (7 points) 

Les caracteristiques les plus importantes du dispositif pyrotechnique qui permet d'assurer le 
gonflement d'un airbag sont la moyenne m et I'ecart-type <7 du delai entre la mise a feu et 
I'explosion, delai que I'on supposera gaussien. Lors de I'etude d'un certain type de dispositif 
d'allumage, les resultats des mesures effectuees sur un echantillon de taille 10, ont ete, en 
millisecondes : 


27, 28, 38, 32, 30, 28, 27, 30, 29, 31 

Toutes les estimations par intervalle seront faites au niveau de confiance de 95%. 

1. Supposons ici que a = 3,2 

a. Determiner I'intervalle de confiance de m et preciser son incertitude. 

b. Quelle est la taille minimale de I'echantillon a considerer si on souhaite estimerm 
avec une incertitude n'excedant pas 1 milliseconde. 


2. Supposons ici que cr est inconnu. 


i. Determiner a nouveau I'intervalle de confiance de m . 

ii. Comparer les deux intervalles de confiance obtenus et interpreter le resultat. 

iii. Determiner I'intervalle de confiance de u . 

b. Un dispositif d'allumage est conforme aux normes actuelles si son delai entre la mise 
a feu et I'explosion est inferieur a 32 millisecondes en moyenne. 

A I'aide d'un test statistique, indiquer si le dispositif etudie est conforme ou pas ? 

3. Dans cette question, on fournit les resultats des mesures effectuees sur un echantillon d'un 
autre dispositif d'allumage : 


25,22,29,26,26,31,30,27 

Le deuxieme dispositif est-il plus performant ? (On pourra faire un test de comparaison de 
deux echantillons) 


Exercice 3. (7 points) 

Dans un echantillon de 1000 personnes d'un certain pays, 40% sont des fumeurs. On observe, par 
ailleurs, que parmi les fumeurs, 175 personnes sont malades; et que parmi les non-fumeurs, 180 le 
sont. 

1) Peut-on affirmer, que dans le pays considere, la proportion de malades est la meme chez les 
fumeurs que chez les non-fumeurs ? 

2) I'Agence Nationale de Securite Sanitaire se demande si le pourcentage de fumeurs dans 
I'echantillon de taille 1000 considere ci-dessus, est conforme a I'idee selon laquelle, la 
proportion de fumeurs a I'echelle du pays tout entier est superieure a 35%. 

a) Realiser le test statistique devant aider I'Agence Nationale de Securite Sanitaire a repondre 
a sa preoccupation. 

b) Quelle est alors la puissance de ce test ? Que traduit-elle ? (On choisira comme hypothese 
alternative pi = 40%) 


Examen de Statistique 

HEI 3 - juin 2014 


- Duree : 2 heures 

- Autorises : calculatrice et recto-verso manuscrit 

- Le bareme n’est donne qu’a titre indicatif 

Sauf mention contraire, on realisera les tests au seuil de 5% en detaillant bien toutes les 
etapes : hypotheses, variable de decision et sa loi, region critique, valeur observee de la 
variable de decision et enfin conclusion 

Exercice 1 (7 points). 

1. On souhaite savoir s’il existe une dependance entre la filiere d’un etudiant en deuxieme annee 
de prepas et son sexe. Pour cela, on dispose des resultats suivants : 



PC 

PSI 

MP 

M 

70 

96 

86 

F 

80 

13 

23 


Quelle est votre conclusion? La reponse sera justifiee a l’aide d’un test du chi 2. 

2. On souhaite maintenant etudier le lien entre la moyenne en Mathematiques d’un etudiant en 
deuxieme annee de prepas (X) et sa moyenne generale (Y). Pour cela, on dispose des moyennes 
suivantes calculees sur un echantillon de 54 etudiants ainsi que des resultats fournis par les 
options graphiques d’Excel et son utilitaire d’analyse (cf. Annexes). 



X 

Y 

In X 

In Y 

moyenne 

10,44 

11,14 

2,33 

2,41 


(a) i. Pour le modele lineaire, determiner l’ordonnee a l’origine de la droite. 

ii. Pour le modele exponentiel, donner le coefficient de determination. 

iii. Pour le modele puissance, completer le resultat fourni par l’utilitaire d’analyse. 

(b) Quel modele ajuste au mieux le nuage de points ? 

(c) En utilisant le meilleur des modeles, donner pour un etudiant ayant une moyenne de 11/20 
en Mathematiques : 

i. Une estimation ponctuelle de sa moyenne generate. 

ii. Un intervalle de prevision de sa moyenne generate. 

Exercice 2 (7 points). 

Les resultats d’une etude menee en 1967 sur 237 enfants, decrits par leur sexe et leur poids en livres 
(1 livre = 0.45 kg), sont resumes ci-dessous. 


Distribution par classes suivant le poids des filles Resume des echantillons filles / gargons 


borne inf 

borne sup 

effectif 



F 

M 


74,5 

10 


moyenne 

98,88 

' 102,90 

74,5 

86,5 

23 


ecart-type corrige 

18,62 

' 19,09 

86,5 

98,5 

21 





98,5 

110,5 

25 





110,5 

122,5 

23 





122,5 


9 






1. Justifier, a l’aide d’un test du chi 2, que le poids des filles peut etre modelise par une loi normale. 

2. En supposant que le poids des gargons peut, lui aussi, etre modelise par une loi normale, etudier 
si la difference entre le poids moyen des filles et celui des gargons est significative ou pas. On 
fera un test bilateral pour comparer les moyennes. 

Dans les deux exercices suivants, on utilisera les sorties Excel fournies que l’on 
completera au besoin. Les differentes etapes des tests mis en oeuvre pour repondre aux 
questions ne sont pas attendues ici. 


Exercice 3 (2 points). 

Les donnees suivantes correspondent a une experience ou 4 dentifrices (Tl, T2, T3 et T4) ont ete 
chacun testes sur 6 personnes afin que soit mesure leur impact sur la blancheur des dents. Tous les 
patients utilisaient auparavant le meme dentifrice. 


Tl 

T2 

T3 

T4 

16 

18 

19 

20 

17 

20 

27 

23 

17 

20 

28 

24 

19 

21 

29 

25 

21 

22 

32 

26 

24 

23 

34 

29 


Une ANOVA a un facteur fournit : 



Le dentifrice a-t-il un effet significatif sur la blancheur des dents ? 


Exercice 4 (4 points). 

Pour etudier l’impact, sur le rendement, de la methode de culture et du type de champ (memes sols, 
mais des expositions differentes), une experience a ete menee oil trois methodes de culture ont ete 
testees sur trois types de champs. 

1. Les rendements mesures apres la moisson sont regroupes dans le tableau suivant : 


Methode 

Champ 1 

Champ 2 

Champ 3 

1 

20 

39 

34 

2 

35 

30 

58 

3 

62 

82 

69 


Une ANOVA a deux facteurs sans repetition fournit : 



(a) La methode a-t-elle un effet significatif sur le rendement de la culture ? 

(b) Le type de champ a-t-il un effet significatif sur le rendement de la culture ? 
2. En repetant l’experience, les resultats suivants ont ete obtenus : 


Methode 

Champ 1 

Champ 2 

Champ 3 

1 

20 

39 

34 


7 

17 

13 

2 

35 

30 

58 


52 

28 

73 

3 

62 

82 

69 


44 

81 

84 


Une ANOVA a deux facteurs avec repetition fournit alors : 

29 ANALYSE DE VARIANCE 



(a) L’interaction entre la methode et le type de champ a-t-elle un effet significatif sur le 
rendement de la culture ? 

(b) La methode a-t-elle un effet significatif sur le rendement de la culture ? 

(c) Le type de champ a-t-il un effet significatif sur le rendement de la culture ? 

(d) Comparer les resultats obtenus aux questions l.(b) et 2.(c). 


Annexe 1 : trois graphiques 



Modele exponentiel 
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Modele puissance y = ^i^sx 0 - 5 ** 1 

R J = 0,7639 
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Annexe 2 : trois regressions lineaires 

Regression lineaire entre X (variable explicative) et Y (variable expliquee) 


A 

B 

C 

1 | RAPPORT DETAILLE 

2 

3 Statistiques de ia regression 

4 Coefficient de determination multiple 

0,889042772 


5 Coefficient de determination R‘2 

0,790397051 


6 Coefficient de determination R‘2 

0,786366225 


7 Erreur-type 

0,564325256 


8 Observations 

54 


9 



10 I ANALYSE DE VARIANCE 

11 

Degre de iiberte 

Somme des carres 

12 Regression 


62,44680762 

13 Residus 

52 

16,56007571 

14 Total 

53 

79,00688333 

is rz 

16 

Coefficients 

Erreur-type 

17 Constante 


0,448125169 

18 GR1 = X 

0,592240519 

0,042293389 


Regression lineaire entre X (variable explicative) et In Y (variable expliquee) 


A 

B 

C 

1 | RAPPORT DETAILLE 

2\ 

3 Statistiques de ia regression 

4 Coefficient de determination multiple 

0,884335973 


5 Coefficient de determination R'2 

0,782050113 


6 Coefficient de determination R'2 

0,777858769 


7 Erreur-type 

0,049075465 


8 Observations 

54 


9 



10 ANALYSE DE VARIANCE 

11 

Degre de Iiberte 

Somme des carres 

12 Regression 

1 

0,449376256 

13 Residus 

52 

0,125236864 

14 Total 

53 

0,57461312 

15 

16 

Coefficients 

Erreur-type 

17 Constante 

1,8809562 

0,038970347 

18 GR1 = X 

0,050239818 

0,003677964 


Regression lineaire entre In X (variable explicative) et In Y (variable expliquee) 


A 

B 

C 

1 | RAPPORT DETAILLE 

2 

3 Statistiques de ia regression 

4 Coefficient de determination multiple 

0,874001963 


5 Coefficient de determination R‘2 

0,763879431 


6 Coefficient de determination R‘2 

0,759338651 


7 Erreur-type 

0,051080249 


8 Observations 

54 


9 



10 ANALYSE DE VARIANCE 

11 

Degre de iiberte 

Somme des carres 

12 Regression 

1 

0,438935143 

13 Residus 

52 

0,135677977 

14 Total 

53 

0,57461312 

15 

16 

Coefficients 

Erreur-type 

17 Constante 

??? 

0,098104382 

18 In X 

??? 

0,041973112 



